2019机器翻译产品的15点胡说
春节假期想到的几点,刚有时间,整理如下:
1、看起来可能的翻译产品形态都已经出现了。2019年,出现《2018年机器翻译产品全景图》之外的产品形态可能性不大。从承载翻译内容的形态看:文本、文档、图片、网页、语音、视频。从语言服务行业战场角度看也是如此:陪同口译、交替传译、同声传译、阅读级笔译、专业级笔译、字幕翻译、网站本地化,甚至包括呼叫中心、速记、同传设备租赁这些业务。拿着机器翻译锤子的人已经把这些钉子敲了一遍。
2、注意我只是说“翻译产品”,如果是内容产品、旅游产品、或是看起来是翻译,定位却不是翻译的产品(比如第一代iphone和诺基亚手机,看起来都是手机,名字也都是phone,但本质完全是两个东西),那就另当别论,毕竟机器翻译和人工翻译重合部分并没有很多人想象的那么大。
3、所以待挖掘的需求和场景还有很多,不仅仅在翻译领域(包括现在最大的现金牛业务——翻译系统私有部署),就看你怎么定义机器翻译这个能力。比如根据《2018翻译机行业发展前景研究报告》,2020年翻译机市场份额接近500亿人民币,和中国人工翻译市场份额差不多。当然这个数据值得推敲,但面向旅游的翻译机市场远大于传统翻译业务下的陪同翻译市场。
4、即使在人工翻译市场,传统的产品和服务形态也面临洗牌:比如文档翻译会扮演什么角色?交互式翻译工具能否冲击CAT工具?是否会有新的人机结合商业模式?垂直领域的机器翻译对译者的吸引力有多大?
5、对非专业人士(他们代表了大几个数量级的用户群)来说,不管背后的技术是简单还是复杂,“看起来”智能很重要。2018年流行的三个机器翻译产品——文档翻译、翻译机、机器同传,已经验证了这一点。就像春晚刘谦的魔术,抛开他反复强调绝没有托儿、后半场“换壶”这种败笔,从产品设计的角度,他的魔术是一个成功的产品。
6、从人工翻译视角看,翻译是一个小众、低频、不那么刚性的需求。从信息流动视角看,翻译是一个大众、高频、刚性的需求。“信息渴望自由”,在信息流动的三大障碍里,翻译是其中一个。
7、你肯定想知道是哪三大障碍?某大型局域网、人与机器之间的信息流动、人与人之间的语言障碍。
8、你也许想知道是哪位权威人士说的?哈哈,只是《关于机器翻译观察的几句话》里提到了。
9、言归正传。从信息流动的角度,更具体地说,从信息发布、信息交换、信息获取三个场景,机器翻译应该有更多的脑洞可开,更大的社会生产力要释放,更重要的使命要完成。
10、用什么形容现在的机器翻译呢?或许,2039年,老师这样跟小朋友们解释”地球村“:哦,地球村叫了很多年,但谁也不知道那是个什么村。二十年前那时候,地球村刚通了马路。“又或者,我联想到了古登堡印刷术带来的革命。
11、忽然想到有大学同学在研究的脑机接口……想多了吧?
12、好吧,科幻结束。回到现在,可以“剧透”的是:机器同传、翻译机(翻译耳机)、文档翻译阵营会继续扩大。其实还应该有一个“网页翻译”,但因为谷歌网页翻译插件太有名了,体验也足够好(除了没有双语模式),估计跟进者有限。这四种产品背后都有一个共同点:要速度,牺牲精度。大力出奇迹,看起来都很美。
13、《银河系漫游指南》里的巴别鱼,《流浪地球》里国际空间站的翻译耳机,已经为翻译机的演化形态指明了方向。虽然因为种种原因,现在的“主流”翻译机还是手持的形态。
14、兼顾速度和精度的产品形态,比如视频翻译(支持译后编辑的)、交互式机器翻译、专业领域文档翻译,是避开“门口的野蛮人”、打造数据闭环、允许细水长流、有时间构筑壁垒的好模式。
15、最后一条很不“胡说”:我的结论都是错的。